<!doctype html>
<html lang="zh-cn">
  <head>
    <title>人工智能之机器学习 // JW Blog</title>
    <meta charset="utf-8" />
    <meta name="generator" content="Hugo 0.60.1" />
    <meta name="viewport" content="width=device-width, initial-scale=1" />
    <meta name="author" content="John Doe" />
    <meta name="description" content="" />
    <link rel="stylesheet" href="https://duyi111.gitee.io/css/main.min.f90f5edd436ec7b74ad05479a05705770306911f721193e7845948fb07fe1335.css" />

    
    <meta name="twitter:card" content="summary"/>
<meta name="twitter:title" content="人工智能之机器学习"/>
<meta name="twitter:description" content="1.人工智能概述 人工智能发展必备三要素:  数据 算法 计算力  计算力之CPU和GPU对比:  CPU主要适合I\O密集型的任务 GPU主要适合计算密集型的任务,并行运算      人工智能和机器学习,深度学习的关系  机器学习是人工智能的一个实现途径 深度学习是机器学习的一个方法(神经网络)发展而来  人工智能发展历程  起源:  图灵测试 达特茅斯会议   发展:  起步发展期&raquo;反思发展期&raquo;应用发展期&raquo;低迷发展期&raquo;稳步发展期&raquo;蓬勃发展期    人工智能的主要分支  1.计算机视觉 2.自然语言处理  语音识别 文本挖掘 机器翻译   3.机器人  2.机器学习 机器学习的定义  机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测  机器学习的工作流程  1.获取数据 2.数据基本处理 3.特征工程 4.机器学习(选择合适的算法) 5.模型评估(评估训练好的模型)  结果达到要求,上线服务 结果未达到要求,重新以上步骤    数据集介绍  概念:  样本: 一行数据 特征: 一列数据 目标值: 标签值,预测的结果   数据类型  有目标有特征值(目标值连续,离散) 只有特征值没有目标值   数据分割  训练集: 用于机器学习,所占比例80%, 70%, 75% 测试集: 用于模型评估,所占比例20%, 30%, 25%    数据基本处理  即对数据进行缺失值,去除异常值等处理 去除数据值时按照样本去除  特征工程  定义: 特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程 意义:决定了机器学习效果的上限 内容  特征提取: 将任意数据转换为数字特征 特征预处理: 将数据转换为更适合机器模型数据的过程 特征降维: 减少特征个数    3."/>

    <meta property="og:title" content="人工智能之机器学习" />
<meta property="og:description" content="1.人工智能概述 人工智能发展必备三要素:  数据 算法 计算力  计算力之CPU和GPU对比:  CPU主要适合I\O密集型的任务 GPU主要适合计算密集型的任务,并行运算      人工智能和机器学习,深度学习的关系  机器学习是人工智能的一个实现途径 深度学习是机器学习的一个方法(神经网络)发展而来  人工智能发展历程  起源:  图灵测试 达特茅斯会议   发展:  起步发展期&raquo;反思发展期&raquo;应用发展期&raquo;低迷发展期&raquo;稳步发展期&raquo;蓬勃发展期    人工智能的主要分支  1.计算机视觉 2.自然语言处理  语音识别 文本挖掘 机器翻译   3.机器人  2.机器学习 机器学习的定义  机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测  机器学习的工作流程  1.获取数据 2.数据基本处理 3.特征工程 4.机器学习(选择合适的算法) 5.模型评估(评估训练好的模型)  结果达到要求,上线服务 结果未达到要求,重新以上步骤    数据集介绍  概念:  样本: 一行数据 特征: 一列数据 目标值: 标签值,预测的结果   数据类型  有目标有特征值(目标值连续,离散) 只有特征值没有目标值   数据分割  训练集: 用于机器学习,所占比例80%, 70%, 75% 测试集: 用于模型评估,所占比例20%, 30%, 25%    数据基本处理  即对数据进行缺失值,去除异常值等处理 去除数据值时按照样本去除  特征工程  定义: 特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程 意义:决定了机器学习效果的上限 内容  特征提取: 将任意数据转换为数字特征 特征预处理: 将数据转换为更适合机器模型数据的过程 特征降维: 减少特征个数    3." />
<meta property="og:type" content="article" />
<meta property="og:url" content="https://duyi111.gitee.io/post/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD%E4%B9%8B%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/" />
<meta property="article:published_time" content="2020-01-05T21:14:52+08:00" />
<meta property="article:modified_time" content="2020-01-05T21:14:52+08:00" />


  </head>
  <body>
    <header class="app-header">
      <a href="https://duyi111.gitee.io/"><img class="app-header-avatar" src="/avatar.jpg" alt="John Doe" /></a>
      <h1>JW Blog</h1>
      <p>Lorem ipsum dolor sit amet, consectetur adipiscing elit. Nunc vehicula turpis sit amet elit pretium.</p>
      <div class="app-header-social">
        
      </div>
    </header>
    <main class="app-container">
      
  <article class="post">
    <header class="post-header">
      <h1 class ="post-title">人工智能之机器学习</h1>
      <div class="post-meta">
        <div>
          <svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round" class="icon icon-calendar">
  <title>calendar</title>
  <rect x="3" y="4" width="18" height="18" rx="2" ry="2"></rect><line x1="16" y1="2" x2="16" y2="6"></line><line x1="8" y1="2" x2="8" y2="6"></line><line x1="3" y1="10" x2="21" y2="10"></line>
</svg>
          Jan 5, 2020
        </div>
        <div>
          <svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round" class="icon icon-clock">
  <title>clock</title>
  <circle cx="12" cy="12" r="10"></circle><polyline points="12 6 12 12 16 14"></polyline>
</svg>
          1 min read
        </div></div>
    </header>
    <div class="post-content">
      <h2 id="1">1.人工智能概述</h2>
<h4 id="heading">人工智能发展必备三要素:</h4>
<ul>
<li>数据</li>
<li>算法</li>
<li>计算力
<ul>
<li>计算力之CPU和GPU对比:
<ul>
<li>CPU主要适合I\O密集型的任务</li>
<li>GPU主要适合计算密集型的任务,并行运算</li>
</ul>
</li>
</ul>
</li>
</ul>
<h4 id="heading1">人工智能和机器学习,深度学习的关系</h4>
<ul>
<li>机器学习是人工智能的一个实现途径</li>
<li>深度学习是机器学习的一个方法(神经网络)发展而来</li>
</ul>
<h4 id="heading2">人工智能发展历程</h4>
<ul>
<li>起源:
<ul>
<li>图灵测试</li>
<li>达特茅斯会议</li>
</ul>
</li>
<li>发展:
<ul>
<li>起步发展期&raquo;反思发展期&raquo;应用发展期&raquo;低迷发展期&raquo;稳步发展期&raquo;蓬勃发展期</li>
</ul>
</li>
</ul>
<h4 id="heading3">人工智能的主要分支</h4>
<ul>
<li>1.计算机视觉</li>
<li>2.自然语言处理
<ul>
<li>语音识别</li>
<li>文本挖掘</li>
<li>机器翻译</li>
</ul>
</li>
<li>3.机器人</li>
</ul>
<h2 id="2">2.机器学习</h2>
<h4 id="heading4">机器学习的定义</h4>
<ul>
<li>机器学习是从<strong>数据</strong>中自动分析获得<strong>模型</strong>,并利用模型对未知数据进行<strong>预测</strong></li>
</ul>
<h4 id="heading5">机器学习的工作流程</h4>
<ul>
<li>1.获取数据</li>
<li>2.数据基本处理</li>
<li>3.特征工程</li>
<li>4.机器学习(选择合适的算法)</li>
<li>5.模型评估(评估训练好的模型)
<ul>
<li>结果达到要求,上线服务</li>
<li>结果未达到要求,重新以上步骤</li>
</ul>
</li>
</ul>
<h4 id="heading6">数据集介绍</h4>
<ul>
<li>概念:
<ul>
<li>样本: 一行数据</li>
<li>特征: 一列数据</li>
<li>目标值: 标签值,预测的结果</li>
</ul>
</li>
<li>数据类型
<ul>
<li>有目标有特征值(目标值连续,离散)</li>
<li>只有特征值没有目标值</li>
</ul>
</li>
<li>数据分割
<ul>
<li>训练集: 用于机器学习,所占比例80%, 70%, 75%</li>
<li>测试集: 用于模型评估,所占比例20%, 30%, 25%</li>
</ul>
</li>
</ul>
<h4 id="heading7">数据基本处理</h4>
<ul>
<li>即对数据进行缺失值,去除异常值等处理</li>
<li>去除数据值时按照<strong>样本</strong>去除</li>
</ul>
<h4 id="heading8">特征工程</h4>
<ul>
<li>定义: 特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程</li>
<li>意义:决定了机器学习效果的上限</li>
<li>内容
<ul>
<li>特征提取: 将任意数据转换为数字特征</li>
<li>特征预处理: 将数据转换为更适合机器模型数据的过程</li>
<li>特征降维: 减少特征个数</li>
</ul>
</li>
</ul>
<h2 id="3">3.机器学习算法分类</h2>
<h4 id="11">1.有监督学习</h4>
<ul>
<li>输入：有特征值，有目标值</li>
<li>输出：
<ul>
<li>连续：回归问题</li>
<li>离散：分类问题</li>
</ul>
</li>
</ul>
<h4 id="21">2.无监督学习</h4>
<ul>
<li>输入：只有特征值</li>
</ul>
<h4 id="31">3.半监督学习</h4>
<ul>
<li>输入：部分有目标值，部分没有目标值</li>
</ul>
<h4 id="4">4.强化学习</h4>
<ul>
<li>自动连续决策的过程</li>
<li>要素：agent，action，environment，observation，reward</li>
</ul>
<h2 id="41">4.模型评估</h2>
<ul>
<li>分类模型评估
<ul>
<li>准确率，精准率，召回率，&hellip;</li>
</ul>
</li>
<li>回归模型评估
<ul>
<li>均方根误差，平均绝对误差&hellip;</li>
</ul>
</li>
<li>拟合
<ul>
<li>欠拟合：学到的特征太少，在训练集中表现不好</li>
<li>过拟合：学到的特征太多，在训练集中表现很好，在测试集中表现不好</li>
</ul>
</li>
</ul>
<h2 id="5">5.深度学习简介</h2>
<ul>
<li>从神经网络发展而来</li>
<li>低层负责简单的内容，越往高层越复杂</li>
</ul>

    </div>
    <div class="post-footer">
      
    </div>
  </article>

    </main>
  </body>
</html>
